#agentes de búsqueda

DailyReport: Evaluación de agentes de búsqueda en tareas diarias

Descubre cómo el nuevo benchmark DailyReport evalúa agentes de búsqueda basados en IA en tareas cotidianas. Resultados muestran que aún no cumplen expectativas.

2026-06-12 · 2 min

TAPO: Optimización de Políticas Consciente de Herramientas

¿Sabías que los agentes de búsqueda multimodal penalizan herramientas útiles? TAPO corrige este error con transferencia de crédito, mejorando el aprendizaje sin costo extra.

2026-06-06 · 2 min

COMPASS: Alineación con MCTS para Agentes de Búsqueda Seguros

COMPASS es un nuevo marco de alineación con MCTS que asegura agentes de búsqueda sin perder utilidad, usando menos datos.

2026-06-03 · 2 min

LocalSearchBench: Evaluación de búsqueda agéntica en servicios locales reales

¿Sabías que los mejores modelos de IA solo aciertan el 35% en búsquedas locales? Descubre LocalSearchBench, el primer benchmark de búsqueda agéntica. ¡Entra!

2026-06-03 · 5 min

Enmascarar observaciones obsoletas: ¿ayuda o perjudica a los agentes de búsqueda?

Descubre cómo el enmascaramiento de observaciones obsoletas afecta a los agentes de búsqueda. Aprende cuándo mejora y cuándo empeora el rendimiento.

2026-06-02 · 3 min

LongTraceRL: Razón de largo contexto con recompensas de rúbrica

LongTraceRL mejora el razonamiento en contexto largo usando recompensas de rúbrica y distractores por niveles desde trayectorias de agentes de búsqueda.

2026-06-01 · 1 min